import matplotlib.pyplot as plt
import numpy as np
import pandas as pd

plt.rcParams['font.family']=['SimHei']
plt.rcParams['axes.unicode_minus']=False

data=pd.read_csv('风景名胜区.csv',encoding='gbk')
print(data.head())

#处理空值
# print(data[data["总面积(平方公里)"].isna()==True])
# print(data[data["游客量(万人次)"].isna()==True])
# 用平均值填充空值
data=data.fillna({"总面积(平方公里)":data["总面积(平方公里)"].mean(),"游客量(万人次)":data["游客量(万人次)"].mean()})
#河北省游客数据
hebei=dict([x for x in data.groupby('省份')])['河北']
print(hebei)

# 景点面积和游客数量的条形图
names=hebei['名称'].values
area=hebei["总面积(平方公里)"].values
tourist=hebei["游客量(万人次)"].values
x=np.arange(len(names))
plt.bar(x-0.1,area,width=0.2,label='总面积')
plt.bar(x+0.1,tourist,width=0.2,label='游客量')
plt.legend()
plt.xticks(x,names,rotation=20)
plt.ylabel('单位:平方公里/万人次')
plt.title('河北省各景点面积和游客数量')
plt.show()
# 游客数量的饼图
plt.pie(tourist,labels=names,autopct='%.2f%%')
plt.title('河北省各景点游客数量占比')
plt.show()